Estamos testemunhando uma grande mudança no processo de geração de imagens. O recente influxo e crescimento do aprendizado automático e da inteligência artificial levanta questões sobre a maneira como os processos criativos evoluem e se desenvolvem por meio da tecnologia. Sistemas como DALL-E, DALL-E 2 e Midjourney são programas de IA (inteligência artificial) treinados para gerar imagens a partir de descrições de texto usando um conjunto de dados de texto-imagem. O conjunto diversificado de recursos inclui a criação de versões antropomorfizadas de animais e objetos, combinando conceitos não relacionados de maneiras plausíveis e transformando imagens existentes.
DALL-E e sistemas similares são capazes de criar imagens plausíveis para uma grande variedade de frases que exploram a estrutura composicional da linguagem. O DALL-E tem alguns recursos semelhantes aos usados no processo de renderização 3D, mas a diferença está na natureza do comandos iniciais. Para a renderização 3D, o comando inicial deve ser especificado em detalhes completos, enquanto DALL-E geralmente é capaz de “preencher os espaços em branco”. Ele também pode controlar independentemente os atributos de um pequeno número de objetos.
Um dos recursos mais interessantes é a capacidade de combinar conceitos não relacionados e isso pode ter implicações para os campos da arquitetura e do design. Os modelos generativos de IA incentivam os arquitetos e designers a explorar um maior número de possibilidades a partir de uma nova perspectiva, pois diminuem o tempo entre a intenção e a execução. Eles oferecem uma maneira acessível de brincar com dados e gerar variações criativas para as soluções dos problemas.
Alguns pesquisadores estão chamando isso de “serendipidade artificial”, sistemas que maximizam a oportunidade de serendipidade, abrindo o leque das capacidades criativas para além dos métodos clássicos. Os arquitetos já estão experimentando essas ferramentas para explorar questões complexas como o planejamento urbano e as possibilidades dos espaços existentes. Outros estão combinando palavras-chave arquitetônicas com clichês de design contemporâneo, referências à cultura pop e vários estilos de arte para projetar edifícios ou simplesmente explorar a natureza das tendências de design e tecnologia.
Embora esses modelos tenham limitações, o campo está evoluindo em um ritmo sem precedentes. Recentemente, a Apple lançou Gaudi, um “arquiteto neural” que leva esse processo um passo adiante, criando cenas 3D a partir de comandos de texto como “suba as escadas” ou “passe pelo corredor”. É difícil prever onde essas tecnologias nos levarão, mas seu impacto já pode ser sentido. Nos campos da arquitetura e do design, elas podem ser entendidas como ferramentas poderosas para explorar, otimizar e testar ideias criativas muito rapidamente.